查看原文
其他

排序分析(Ordination Analysis)

生物空间站 生物空间站 2022-07-09

推荐阅读

1.ggplot2绘制曼哈顿图示例
2.phyloseq | 用 R 分析微生物组数据及可视化
3.R语言PCA分析教程 | Principal Component Methods in R
4.vegan包进行微生物群落主坐标分析(PCoA)及ggplot2作图
5.R语言 | 相关性分析

如今,排序分析也被广泛应用到微生物组(microbiome)的分析中。PCA分析、PCoA分析、CCA分析、RDA分析、NMDS分析、是微生物多样性分析过程中耳熟能详的方法,他们在对于物种/基因等的分析过程中十分重要,在16S测序及宏基因组测序中较为常见。但是这几种分析方法具体有什么区别,以及该如何用?

这几种方法均属于排序分析,排序分析的目的主要是为了降维、探索性分析!

排序分析的分类


1.间接排序法(indirect ordination analysis):在特定的梯度(环境轴)上探讨物种的变化情况。

2.直接排序法(direct ordination analysis):寻求潜在的(latent)或间接的环境因子来探讨物种数据的变化。

RDA基于线性模型,CCA则是基于单峰模型。一般我们会选择CCA来做直接梯度分析。但是,如果CCA排序的效果不太好,就可以考虑换做用RDA分析。db-RDA是目前在微生物领域应用的最为广泛的环境因子分析,该分析方法内置在R中的vegan包中。

如何选择用单峰模型还是线性模型?
(1) 用DCA(vegan::decorana())先对数据(site-species)进行分析;
(2) 查看结果中的“Axis lengths”的第一轴DCA1的值,根据该值判断该采用线性模型还是单峰模型:
  • 如果大于4.0,就应该选单峰模型;

  • 如果3.0-4.0之间,选线性模型或者单峰模型均可;

  • 如果小于3.0, 线性模型的结果要好于单峰模型

#判断选择用单峰模型还是线性模型 decorana()install.packages('vegan')library('vegan')data(varespec)vare_dca<-decorana(varespec)vare_dca

该案例中,Axis lengths 最大值为2.8161,小于3,线性模型(PCA 和RDA)更好一些。


在非限制性排序中,16S和宏基因组数据分析通常用到的是PCA分析和PCoA分析。两者的区别在于:PCA分析是基于原始的物种组成矩阵所做的排序分析,而PCoA分析则是基于由物种组成计算得到的距离矩阵得出的。

NMDS非度量多维尺度法是一种将多维空间的研究对象(样本或变量)简化到低维空间进行定位、分析和归类,同时又保留对象间原始关系的数据分析方法。适用于无法获得研究对象间精确的相似性或相异性数据,仅能得到他们之间等级关系数据的情形。


我就知道你在看👇

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存